
KI in Standardsituationen besser als Mediziner, aber …
In einer Studie der Philipps-Universität Marburg und des Universitätsklinikums Gießen und Marburg wurde untersucht, wie gut 13 öffentlich verfügbare KI-Sprachmodelle klinisches Wissen zur akuten Nierenschädigung abrufen und anwenden können.
Im Frühjahr vergangenen Jahres nahmen 123 Teilnehmer des DGIM-Jahreskongresses in Wiesbaden an einer Studie teil, die untersuchte, wie 13 öffentlich verfügbare KI-Sprachmodelle Informationen zu akuten Nierenschädigungen abrufen und anwenden können. Dabei bearbeiteten die teilnehmenden Medizinstudenten und Ärzte der Inneren Medizin ebenso wie ihre Konkurrenz einen deutschsprachigen Wissenstest mit zwei realistischen Patientenfällen und 15 Multiple-Choice-Fragen.
Das kürzlich veröffentlichte Ergebnis zeigte, dass die KI-Sprachmodelle im Durchschnitt 90 Prozent der Fragen korrekt beantworteten, während die Studienteilnehmer nur 49 Prozent erreichten. Mehrere Modelle lösten alle Fragen korrekt und benötigten dabei deutlich weniger Zeit als die Menschen.
Damit konnte die Studie zeigen: Große Sprachmodelle sind in der Lage, leitlinienkonformes medizinisches Fachwissen in standardisierten Fragesituationen sehr zuverlässig wiederzugeben. Studienleiter Dr. Philipp Russ vom interdisziplinären Institut für Künstliche Intelligenz in der Medizin der Universität Marburg, Universitätsklinikum Gießen und Marburg sieht das durchaus als Chance für den klinischen Alltag, nennt aber auch klare Grenzen: „Sie können unter anderem fehlerhafte Inhalte erzeugen, den Menschen nicht in seiner ganzen Komplexität erfassen und keine Empathie empfinden. Ein Sprachmodell sieht nicht, hört nicht und spürt nicht, worum es einem Menschen wirklich geht. Genau deshalb kann es ärztliches Handeln und klinisches Urteil nicht ersetzen. Richtig eingesetzt könnte es uns aber mehr Zeit für das geben, was Patientinnen und Patienten besonders brauchen: Aufmerksamkeit, Zuwendung und menschliche Nähe.“
Ein gutes Abschneiden im Wissenstest bedeute laut den Studienautoren nicht, dass diese Systeme eigenständig klinische Entscheidungen treffen könnten oder gar sollten. „Menschliches Urteilsvermögen und klinische Erfahrung bleiben entscheidend. Die Letztverantwortung für die Versorgung von Patientinnen und Patienten liegt weiterhin klar bei den behandelnden Ärztinnen und Ärzten“, unterstreicht der Marburger Nephrologe und KI-Experte Prof. Dr. med. Ivica Grgic.
Die Wissenschaftler sehen Künstliche Intelligenz derzeit als hilfreiches, unterstützendes Werkzeug. Allerdings wirft die rasante Entwicklung auf dem Gebiet viele Fragen auf, beispielsweise ob KI autonome Funktionen übernehmen könnte oder überhaupt sollte. Die Studienautoren sehen die Integration in die klinische Praxis daher als schrittweisen Prozess, der einer kontinuierlichen fachlichen, regulatorischen und ethischen Reflexion bedarf.

Sansert - stock.adobe.com
BIOPRO Baden-Württemberg GmbH / Frank Eppler
Broad Institute, MIT Boston